查看原文
其他

Cell Rep Med︱聂秀/孟斌/全雪萍团队使用自注意力增强的卷积神经网络预测结直肠癌微卫星不稳定性

全雪萍 岚翰学术快讯
2024-08-26




文︱全雪萍

责编︱王思珍,方以一

编辑︱杨彬薇


结直肠癌(CRC)是中国第四大常见恶性肿瘤。其中15%的结直肠癌中发生的错配修复(MMR)缺陷导致微卫星不稳定(MSI),是促进肿瘤发生的一种独特机制。MSI已越来越多地用于指导结直肠癌的化疗和免疫治疗。当前PCR和免疫组化检测MSI的敏感性和特异性很高,但这些检测方法需要较长时间的人工投入,并需要具有多年经验的病理学医师判读才能达到高准确率。人工智能开启精准病理诊断新时代。MSI-H/dMMR结直肠癌切片中具有较为特殊的病理学特征,如肿瘤浸润淋巴细胞和黏液分化等。因此可通过深度学习等人工智能手段来基于病理切片扫描片识别MSI的状态。


2023年1月30日,华中科技大学同济医学院附属协和医院病理科聂秀教授、天津医科大学肿瘤医院病理科孟斌教授、上海桐树生物科技有限公司全雪萍博士等合作在Cell Reports Medicine上发表了题为“Predicting colorectal cancer microsatellite instability with a self-attention-enabled convolutional neural network”的研究。该研究构建了包含1579个结直肠癌患者的多中心中国人群队列,通过整合卷积神经网络模型INSIGHT,和基于自注意机制的模型WiseMSI,实现了基于H&E染色的病理切片扫描片,准确识别患者的MSI状态。INSIGHT对肿瘤和正常组织分类识别的AUC值高达0.98,并基于此分类计算肿瘤纯度,与病理专家人工判读的肿瘤纯度Pearson相关系数为0.7909. WiseMSI对MSI的预测特异性为94.7% (95% CI 93.7% - 95.7%),灵敏度为84.7% (95% CI 82.6% - 86.9%),  AUC值为0.954 (95% CI 0.948 - 0.960).在对比分析中,该方法相比五种经典深度学习方法具有更好的性能。



研究者使用ResNet18对包含254张病理图像的25349张正常区域的小图片及25235张肿瘤小图片进行训练构建了一个高精度的模型INSIGHT,随后在51张病理图像的2549张正常小图片及2373张肿瘤小图片进行测试(图1A),显示分类识别的AUC高达0.985,并且基于此分类计算肿瘤纯度,与病理专家判读的肿瘤纯度Pearson相关系数为0.7909。


随后研究者将肿瘤区域的小图片挑选出来通过基于ImageNet预训练的ResNet50提取肿瘤组织特征。并基于池化注意力机制的神经网络WiseMSI将小图片层级特征进行整合,预测MSI的状态(图1B)。自注意力网络结构(图1C)。


图1 INSIGHT及WiseMSI模型训练和测试的工作流与网络结构

(图源:Chang XN, et al.Cell Reports Medicine, 2023)


该多中心队列TSMCC1579张病理图像,其中997MSS图像,582MSI-H图像,为了评估模型可靠性,研究者随机将其分为10个子集进行了交叉验证,最终WiseMSIMSI的预测特异性为94.7% (95% CI 93.7% - 95.7%),灵敏度为84.7% (95% CI 82.6% - 86.9%),  AUC值为0.954 (95% CI 0.948 - 0.960).研究者选取了在Laleh等的基准分析中表现优异的4个模型:经典弱监督路线的EfficientNetViT、多实例学习路线的MILAttMIL,以及DeepSMILE中的VarMIL模型,使用TSMCC队列进行训练测试,与WiseMSI 进行性能比较,INSIGHT+WiseMSI表现出更高的性能。


图2 INSIGHT及WiseMSI模型训练和测试的工作流与网络结构

(图源:Chang XN, et al.Cell Reports Medicine, 2023)


WiseMSI模型的肿瘤区域注意力分数图反映了MSI-H患者和MSS患者之间肿瘤的差异(图3),具有高注意力分数的红点对预测MSI状态的贡献比具有低注意力分数的蓝点更大。MSI-H病理图像中红点中的细胞形态分化较差,而MSS病理图像中的细胞形态分化较高。这与Greenson[1]Kather[2]以前的发现类似。这一发现进一步证实了组织病理学特征可以作为MSI状态的预测因子,并说明了通过深度学习方法从H&E染色切片中检测MSI的原因。因此,注意力得分所突出的区域提供了一种可视化和解释深度学习模型预测的方法。


图3 肿瘤区域注意力分数图及放大图

(图源:Chang XN, et al.Cell Reports Medicine, 2023)


研究者进一步研究了WiseMSICRC患者的不同临床病理学亚组中的预测稳健性。本研究数据集的结直肠癌患者包括七个人口学、解剖学和病理学上不同的亚组,包括结肠癌、直肠癌、左右半结肠癌、低和中等组织学分化程度、有或没有林奇综合征、不同临床分期、年龄和性别。WiseMSI的表现在临床分期和患者年龄方面存在一些差异:AUC值为I期癌症(n = 35 WSIs)的0.79II期(n = 164 WSIs)的0.94III期(n = 133 WSIs)的0.95(图4C);年龄<40岁(n = 58 WSIs)的0.87、年龄大于40岁且小于等于70岁(n = 823 WSIs)的0.9070岁以上(n = 216 WSIs)为0.80(图4B)WiseMSI的分类表现与解剖学特征相关的变化相对较小:结肠癌(n = 753 WSIs)的AUC值为0.92、直肠癌(n = 247 WSIs)为0.85(图4E);左半结肠癌(n = 228 WSIs)的AUC值为0.85、右半结肠癌(n = 58 WSIs)为0.93(图4F)WiseMSI的分类表在与组织学分化程度、林奇综合征和性别相关的亚组中非常稳定(AUC值约为0.90)。总的来说,WiseMSI模型在所有研究的亚组中对MSI的预测表现良好。


研究者在用外部数据 TCGA-COADREAD队列对WiseMSI进行验证时,AUC从交叉验证的95.4%降到71.8%,其中灵敏度76.6%,特异性46.5%,但在不同种族来源的数据中显出极大的差异,对12个来自亚洲人群样本的MSI的预测正确性、灵敏度、特异性均达到了100%。目前在其他同类型研究中,AI模型训练和测试数据主要来自欧美人群,亚洲人群代表性样本不足。


图4 WiseMSI在结直肠癌患者异质性临床病理亚组MSI预测中的表现

(图源:Chang XN, et al.Cell Reports Medicine, 2023)


随后研究者进一步研究了WiseMSI预测结直肠癌患者生存情况的稳健性。TSMCC队列中有293名患者具备人口学和临床信息,在排除了63名没有生存数据的结直肠癌患者后,生存分析中包括了 226 名结直肠癌患者。通过PCR+毛细管电泳分析,21名患者是MSI-H205名患者是MSSMSI-H患者的60个月无病生存期Disease-free survivalDFS)率高于MSS患者(MSI-H100.0%对MSS83.9%)。WiseMSI模型中有14MSI-H患者和212MSS患者。预测为MSI-H的患者的60个月DFS率也高于预测为MSS的患者(MSI-H100.0%对MSS84.4%)。此外,MSS患者的DFS与预测为MSS的患者的相当(MSS58.3±1.5个月,95CI 55.361.3个月对预测的MSS58.6±1.5个月,95CI 55.761.5个月)。MSI状态对预后的影响与肿瘤临床分期有关。MSI是II-III期结直肠癌的阳性预后因素。


文章结论与讨论,启发与展望
综上所述,研究者构建了一个强大且可解释的MSI预测模型WiseMSI,该模型在结直肠癌MSI预测方面具有出色的诊断性能,其预测水平与目前使用PCR和ICH的方法相近。肿瘤检测模型INSIGHT与病理学专家在肿瘤纯度百分比估计方面的高度相关性,为病理学专家提供了支持。通过先给予AI评估,然后病理学家重新检查和确认,减轻病理学医师繁琐耗时的日常工作负担。对于切片上组织分散的样本,或者肿瘤穿插于正常细胞背景中的样本,INSIGHT的估计往往比病理学家的估计更准确。研究进一步表明,基于注意力机制的模型预测的MSI可以对结直肠癌患者的DFS进行分层,这表明预测的MSI可能作为指导结直肠癌治疗的生物标志物。此外,WiseMSI具有较高的特异性,其性能与基于PCR-毛细管电泳的MSI检测相当。研究表明,WiseMSI可用于结直肠癌患者MSI状态的早期筛查,作为PCR -毛细管电泳检测的替代品或补充。在未来,研究计划通过检查临床病理变量和临床结果来评估该模型,以便构建优化的MSI预测模型。

链接:https://www.cell.com/cell-reports-medicine/fulltext/S2666-3791(22)00493-1


通讯作者:全雪萍博士

(照片提供自:全雪萍团队)

通讯作者简介(上下滑动阅读)

全雪萍博士,北京“高聚”人才,英国爱丁堡大学生物信息学博士,爱丁堡大学智能系统及应用中心(CISA)、帝国理工大学等科研院所博士后,先后承担欧盟、欧洲学术研究委员会和英国心脏基金会等多项大型课题。熟悉生物信息、人工智能、精准医学领域等,发表多篇国际SCI文章和多项专利。


欢迎扫码加入岚翰生命科学:文献学习2
群备注格式:姓名-单位-研究领域-学位/职称/称号/职位

往期文章精选【1】PLoS Genet︱郑道琼/Thomas D. Petes团队合作阐释转座子序列驱动酵母基因组变异规律【2】EMBO Reports︱吴缅/谷皓/邵凤民团队发现血小板型磷酸果糖激酶PFKP作为蛋白激酶调控mESC胚系分化【3】Immunity︱杨庆凯团队揭示机体利用DNA间距离(凝聚程度)识别危险或非我DNA的机制【4】Nat Commun︱曹彦光团队揭示结直肠癌肿瘤响应与复发以及转移病灶所在器官之间的差异性【5】APS︱上海交通大学朱建伟团队开发评价SARS-CoV-2中和抗体广谱性的方法【6】Nat Commun | 林建平/连佳长团队合作发表重构酿酒酵母代谢途径实现24-表-麦角甾醇的高效合成【7】Genome Biol︱何川团队解析YTHDF家族蛋白功能的“不同”与“同”【8】CELL MOL IMMUNOL︱王青青/来利华/夏梦团队揭示FXYD3是银屑病中形成IL-17信号正反馈的关键分子【9】Pharmacol Res︱潘效红/吕军鸿/高雪团队发现提高硒治疗缺氧性肿瘤的新方法【10】Genes Dis 综述︱李奇璋/张磊/沈玉平等评述RRM2在肿瘤发生发展中的作用及研究进展欢迎加入“岚翰生命科学” ”岚翰生命科学“ 诚聘副主编/编辑/运营岗位 (在线办公)

参考文献(上下滑动阅读)

[1] Greenson, J.K., Bonner, J.D., Ben-Yzhak, O., Cohen, H.I., Miselevich, I.,Resnick, M.B., Trougouboff, P., Tomsho, L.D., Kim, E., Low, M., et al. (2003). Phenotype of microsatellite unstable colorectal carcinomas: well-differentiated and focally mucinous tumors and the absence of dirty necro-sis correlate with microsatellite instability. Am. J. Surg. Pathol. 27,563–570.

[2] Kather, J.N., Pearson, A.T., Halama, N., Ja¨ ger, D., Krause, J., Loosen,S.H., Marx, A., Boor, P., Tacke, F., Neumann, U.P., et al. (2019). Deep learning can predict microsatellite instability directly from histology in gastrointestinal cancer. Nat. Med. 25, 1054–1056.

[3] Ghaffari Laleh, N., Muti, H.S., Loeffler, C.M.L., Echle, A., Saldanha, O.L., Mahmood, F., Lu, M.Y., Trautwein, C., Langer, R., Dislich, B., et al. (2022). Benchmarking weakly-supervised deep learning pipelines for whole slide classification in computational pathology. Med. Image Anal. 82, 102622.


本文完

继续滑动看下一个
岚翰学术快讯
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存